大家好,在昨天結束了房價預測模型,迴歸問題這個主題也先告一段落,接著要來看的主題是二元分類問題,同樣也會以一道題目來學習這個主題。
二元分類問題就是只有兩種答案的問題,例如是或否、開或關、贏或輸等等。在二元分類問題要寫的是寶可夢對戰預測,會根據寶可夢的能力值來判斷誰獲勝,在這個問題中會另外使用one-hot encoding表示方法來建立模型,用來比較與數值表示建立模型的準確率差異,one-hot encoding就等用到的時候再作介紹。
這個問題要使用的資料集也是從Kaggle平台下載,名字是「Pokemon-Weedle’s Cave」,解壓縮後會看到三個檔案,在pokemon.csv中有800筆資料,寫有寶可夢的能力值資訊,包含屬性、攻擊力、守備力等等;combats.csv中有50000筆訓練用資料,寫有寶可夢的對戰紀錄資訊,包含對戰的兩隻和獲勝的寶可夢編號;tests.csv提供10000筆測試資料,資訊包含對戰的兩隻寶可夢編號。